我们研究了利润率的二元和多类分类器的精确积极学习。给定一个$ n $ - 点集$ x \ subset \ mathbb {r}^m $,我们想在$ x $上学习任何未知分类器,其类具有有限的strong convex hull保证金,这是一个扩展SVM保证金的新概念。在标准的主动学习环境中,只有标签查询,在最坏的情况下学习具有强凸额的分类器$ \ gamma $需要$ \ omega \ big(1+ \ frac {1} {\ gamma} {\ gamma} \ big big )^{(M-1)/2} $查询。另一方面,使用更强大的种子查询(一种等价查询的变体),可以通过littlestone's缩小算法在$ o(m \ log n)$ Queries中学习目标分类器;但是,减半在计算上效率低下。在这项工作中,我们表明,通过仔细组合两种类型的查询,可以在时间上学习二进制分类器$ \ operatatorName {poly}(n+m)$,仅使用$ o(m^2 \ log n)$ label查询和$ o \ big(m \ log \ frac {m} {\ gamma} \ big)$ seed queries;结果以$ k!k^2 $乘法开销的价格扩展到$ k $ class分类器。当输入点具有界限的位复杂性时,或者仅一个类具有强凸壳边缘时,相似的结果就成立了。我们通过证明在最坏的情况下任何算法需要$ \ omega \ big(k m \ log \ frac {1} {\ gamma} \ big)$ seed $ seed和标签质量质量来学习$ k $ -Class classifier具有强大的凸壳保证金$ \ gamma $。
translated by 谷歌翻译
我们研究供应商和零售商之间的重复游戏,他们希望在不了解问题参数的情况下最大化各自的利润。在用完整的信息表征了舞台游戏的Stackelberg平衡的独特性之后,我们表明,即使有部分了解需求和生产成本的联合分配,自然学习动态也可以保证供应商和零售商共同策略概况的收敛,舞台游戏的平衡。我们还证明了供应商对零售商的遗憾的遗憾和渐近界限的有限时间界限,在该零售商的遗憾中,特定费率取决于玩家初步可用的知识类型。在特殊情况下,当供应商不是战略性的(垂直整合)时,我们证明,当成本和需求是在对抗性和需求时,零售商的遗憾(或等同于社会福利)对零售商的遗憾(或等效地是社会福利)的最佳遗憾。
translated by 谷歌翻译
我们调查了一个非旋转的强盗设置,其中不立即向玩家充满行动的丢失,而是以普遍的方式蔓延到后续轮。通过每轮末端观察到的瞬时损失是先前播放动作的许多损耗组件的总和。此设置包括一个特殊情况,该特例是具有延迟反馈的匪徒的特殊情况,是播放器单独观察延迟损耗的良好反馈。我们的第一个贡献是将标准强盗算法转换为可以在更难的设置中运行的一般减少:我们在原始算法的稳定性和后悔方面绑定了转换算法的遗憾。然后,我们表明,使用Tsallis熵的适当调谐的ftrl的转换具有令人遗憾的$ \ sqrt {(d + 1)kt} $,其中$ d $是最大延迟,$ k $是武器数量,$ t $是时间范围。最后,我们表明我们的结果通常不能通过在此设置中运行的任何算法的遗憾上展示匹配(最多一个日志因子)下限。
translated by 谷歌翻译
我们在延迟设置中研究了非旋转匪徒和专家,其中延迟取决于时间和武器。虽然仅延迟仅取决于时间的延迟已经过度研究,但依赖于扶手的延迟设置更好地以推出新技术挑战的成本更好地捕获现实世界应用。在完整信息(专家)设置中,我们设计了一种具有一阶遗憾的算法,界定延迟和损失之间有趣的权衡。我们证明了类似的一阶遗憾,对于强盗设置,当允许学习者观察丢失有多少损失时。这些是延迟设置中的第一个界限,取决于最佳臂的损耗和延迟。当在强盗设置没有观察到损失以外的信息时,我们仍然可以通过对Zimmert和Seldin算法(2020)的修改来证明遗憾。我们的分析铰链在漂移的新颖界限上,测量算法在一轮超前时可以执行多少算法。
translated by 谷歌翻译
我们在合作在线学习环境中研究反馈与沟通之间的相互作用,在该环境中,代理网络解决了一项任务,其中学习者的反馈由任意图确定。我们表征了反馈图和通信网络之间强产品的独立性数量的遗憾。我们的分析恢复为特殊情况,许多先前已知的界限用于与专家或强盗反馈分布式在线学习的界限。我们的结果的更详细版本还捕获了遗憾对信息遍历每个图所花费的延迟的依赖性。在合成数据上运行的实验表明,我们算法的经验行为与理论结果一致。
translated by 谷歌翻译
我们在反复决策中介绍了一种新颖的投资回报(ROI)最大化的理论框架。我们的环境受到使用案例的,公司经常接受技术创新建议,并希望快速决定是否值得实施。我们设计一种在一系列创新建议上学习ROI最大化决策政策的算法。我们的算法以$ \ min \ big \ {1 /(n \ delta ^ 2),n ^ {-1/3} \} $,其中$N $是创新的数量,$ \ delta $是$ \ pi $的次优差距。我们配方的一系列重大障碍,它将其从其他在线学习问题(如Burdits)中设置,是运行策略不提供对其性能的无偏见估计。
translated by 谷歌翻译
It is well known that conservative mechanical systems exhibit local oscillatory behaviours due to their elastic and gravitational potentials, which completely characterise these periodic motions together with the inertial properties of the system. The classification of these periodic behaviours and their geometric characterisation are in an on-going secular debate, which recently led to the so-called eigenmanifold theory. The eigenmanifold characterises nonlinear oscillations as a generalisation of linear eigenspaces. With the motivation of performing periodic tasks efficiently, we use tools coming from this theory to construct an optimization problem aimed at inducing desired closed-loop oscillations through a state feedback law. We solve the constructed optimization problem via gradient-descent methods involving neural networks. Extensive simulations show the validity of the approach.
translated by 谷歌翻译
Timely and effective response to humanitarian crises requires quick and accurate analysis of large amounts of text data - a process that can highly benefit from expert-assisted NLP systems trained on validated and annotated data in the humanitarian response domain. To enable creation of such NLP systems, we introduce and release HumSet, a novel and rich multilingual dataset of humanitarian response documents annotated by experts in the humanitarian response community. The dataset provides documents in three languages (English, French, Spanish) and covers a variety of humanitarian crises from 2018 to 2021 across the globe. For each document, HUMSET provides selected snippets (entries) as well as assigned classes to each entry annotated using common humanitarian information analysis frameworks. HUMSET also provides novel and challenging entry extraction and multi-label entry classification tasks. In this paper, we take a first step towards approaching these tasks and conduct a set of experiments on Pre-trained Language Models (PLM) to establish strong baselines for future research in this domain. The dataset is available at https://blog.thedeep.io/humset/.
translated by 谷歌翻译
物理量的估计是大多数科学研究的核心,量子设备的使用有望增强其性能。在实际情况下,考虑到资源有限,贝叶斯自适应估计代表了有效分配所有可用资源的有效分配的强大方法,这是至关重要的。但是,该框架依赖于系统模型的精确知识,并以精细的校准检索,通常会在计算和实验要求上导致要求。在这里,我们介绍了一种基于模型和深度学习的方法,以有效地实施实现现实的贝叶斯量子计量任务,以实现所有相关挑战,而无需依靠对系统的任何APRIORI知识。为了克服这一需求,直接对实验数据进行了神经网络,以学习多参数贝叶斯更新。然后,通过通过训练并增强研究量子传感器的实验启发式的训练和增强实验启发式的增强学习算法提供的反馈,将系统设置为最佳工作点。值得注意的是,我们在实验上证明了比标准方法更高的估计性能实现,这证明了这两种黑盒算法在集成光子电路上的组合强度。这项工作是迈向完全基于人工智能的量子计量学的重要一步。
translated by 谷歌翻译
这项工作提出了一种随机变化深内核学习方法,用于从高维噪声数据中发现低维动力学模型的数据驱动。该框架由一个编码器组成,该编码器将高维测量值压缩为低维状态变量,以及用于状态变量的潜在动力学模型,该模型可以预测随时间时间的系统演化。提出的模型的培训是以无监督的方式进行的,即不依赖标记的数据。我们的学习方法是根据摆锤的运动进行评估的,这是通过高维嘈杂的RGB图像测量的非线性模型识别和对照的良好研究基线。结果表明,该方法可以有效地确定测量,学习紧凑的状态表示和潜在的动力学模型,并识别和量化建模不确定性。
translated by 谷歌翻译